[レポート] AWSのAI/Machine Learning/IoT を活用したメディア業界最新事例 #interbee2020
こんにちは、大前です。
本記事は、Inter BEE 2020 ONLINE のセッション「AWSのAI/Machine Learning/IoT を活用したメディア業界最新事例」のセッションレポートです。
セッション情報
セッションタイトル
AWSのAI/Machine Learning/IoT を活用したメディア業界最新事例
セッション概要
メディア業界では視聴体験、作業効率の向上を目的にあるゆる領域でデータ活用が必要になっております。その課題に対してAWSではデータの収集・蓄積・分析・機械学習・デリバリーと幅広くのサービスをご提供しております。本セッションではUSEN様・朝日放送様、共同通信社様にご登壇いただき実際にIoTを活用し新しいサービスや業務改善を実現した事例をお話しいただくともに、国内外の最新事例も数多くご紹介します。
リンク
該当のセッションはこちらから視聴が可能です。
スピーカー
- 結城 悟 氏
- アマゾン ウェブ サービス ジャパン株式会社
- エンタープライズ統括本部 通信・メディア営業本部 シニア マネージャー
- 塚本 健太 氏
- 株式会社USEN
- 取締役 事業開発統括部長
- 荒木 優 氏
- 朝日放送テレビ
- 技術局 技術管理部
- 金澤 隼人 氏
- 一般社団法人共同通信社
- 情報技術局 ソリューショングループ
セッションレポート
- AWS における AI/ML/IoT の取り組み
- メディアの質を上げるためのアーキテクチャをエンドtoエンドでサービスを提供
- 様々なデータを取り込み、用途に応じて様々な出力を行う必要がある
- 事例
- NFL
- アメフトの配信
- 選手のプロテクターにチップが埋め込まれており、リアルタイムでトラッキング等を実施している
- 取り込んだデータは SageMaker に取り込まれ、予測を作成し放送局に通知を行なう
- F1
- 車に 120ものセンサーが搭載されている
- 計測されたデータの他に、順位やタイヤの状況や天候などがインプットとして用いられる
- 追い抜く可能性などをリアルタイム予測し表示
- ソニー様 aibo
- 最新の aibo では AWS を活用
- 運用負荷を低減するマネージドサービスが多く活用されている
- aibo のカメラ映像を確認するために Kinesis Video Streams を利用
- フジテレビ様
- 春高校バレーにおける AWS の活用
- NFL
- コンテンツレイク = データレイク+ メディアアセット
- メディア企業であればアセットを大量に保持している
- 高い耐久性、セキュアな仕組みが求められる
- 用途に応じた連携のしやすさが求められる
- AWS は S3 を提供
- 任意のファイル形式で保存可能
- 容量の上限なし
- 高い耐久性 99.9999999%
- 多様な権限管理や暗号化によるセキュリティ
- API も提供
- 様々なサービスと連携可能
- 最近注目されているのが機械学習サービス
- AWS で機械学習を行う理由
- もっとも広範囲で様々な機械学習サービスを提供している
- SageMaker で機械学習の導入を加速
- もっとも包括的なクラウドプラットフォーム上に構築
サーバレスアーキテクチャによるAIチャンネルと楽曲配信とUMUSICのご紹介
- USEN の紹介
- 1961 年創業
- 店舗で流す BGM サービスを軸に発展
- H/W, S/W 開発からインフラ、コンテンツ調達まで一貫した内製化を実現
- 新プロダクト「U MUSIC」について
- BGM テックを店舗利益につなげる
- コスト削減に貢献
- 来店客を自動で分析し、店内演出を自動可変させる事により、手間の削減(= スタッフの省人化)
- 機能
- BGM プログラムをプリセット
- AI BGM を標準搭載
- AI チューニング
- AI リアルタイムセンシング
- AI エンジンについて
- 500万楽曲についてそれぞれスコアが付与されている
- 店舗集客に影響する 400 項目が存在
- 500万楽曲についてそれぞれスコアが付与されている
- BGM テックを店舗利益につなげる
- AWS の選定理由
- 複数の要件が存在
- クラウドの利点
- 可変要素の大きいシステムであるため、クラウドが持つフレキシビリティがマッチ
- 人的リソースの制限があったことも影響
- AWS の選定理由
- 信頼性の高さ
- 情報量の多さ
- など
- 大量処理に対するスケーラビリティ
- Lambda や DynamoDB、SQS を利用したサーバレスな構成
- サーバレス構成にすることで良かった点
- 同時処理やリトライ処理も AWS 側に任せられるため、運用コストがかなり下がった
- 予測が難しい負荷の変動にも対応可能になった
AWS IoTを用いたタリー伝送システムAirTallyの開発と商品化
- タリーとは?
- カメラについている赤いランプ
- 出演者にどのカメラがアクティブかを知らせるランプ
- 開発の背景
- 一般的なスタジオ撮影
- 優先でカメラとシステムが接続されている
- サブシステムから各カメラに対して情報を返す
- 一般的なゴルフ中継(ワイヤレスカメラ)
- FPU 送信機と呼ばれるものを利用し、映像を中継器に飛ばす
- カメラ側からサブシステムへの一方向の通信であるため、サブシステムからカメラマンへの情報連携は何かしら他の手段が必要
- カメラマン的には視覚的に認知したいという要望が多い
- 一般的な報道中継
- 現場から様々な方法で本社のサブシステムに映像を送信
- 同じく一方向の通信であるためタリーなどは何かしら別の方法で伝える必要がある
- 人や口で伝えているケースが多い
- 一般的なスタジオ撮影
- 一般的な中継ではタリーは存在しない
- 現場に視覚的なタリーを返す事は長年の課題であった
- 要件
- 低遅延
- 低価格
- 簡易
- 無線対応
- 現場でのタリーの「出し方」ラインナップを充実させる
- AirTally の前身を 2017 年に開発
- Raspberry Pi を使用
- 3G 回線を使用
- 数多くのスポーツ中継などで使用
- AirTally 商品化への道
- 民放連賞を受賞し、商品化への要望が多く寄せられた
- 一方でハードの製造、販売のハードルは高かった
- AWS から IoT Core とベンダを紹介いただいた
- ネットワーク型タリー伝送システム AirTally を開発
- システム概要
- SORACOM の LTE-M 回線を使用
- AWS IoT Core を経由して情報を扱う
- 今は GPS マップを Lambda から外部のサービスを叩いているが、AWS 内で稼働させる予定
- AirTally の親機/子機の紹介
- (図ベースの紹介であったため、該当セッションを参照ください。。)
- AWS IoT を用いるメリット
- AWS の他サービスとの連携が容易
- 想像を超える低遅延(回線環境に依存する部分はある)
- ドキュメントやサポートが充実している
- Python の環境が充実している
Amazon Rekognitionを活用した画像検索の効率化について
- 共同通信社について
- 国内/海外のニュースを取材し、各メディアに情報を配信
- IT を駆使した情報伝達の仕組みの開発等にも従事している
- ぽっと出 画像検索について
- 報道では突然素材の少ない人物の写真が必要になることがある
- 毎年大量の画像が格納されているが、全てに手作業でメタデータをつけることは不可能
- 今までは記憶を頼りに手作業で探していた
- 顔称号機能を利用して適切な写真を効率よく検索できるようにしたい
- どんなシステム?
- 顔写真を使って写真を検索するシステム
- 写真説明に人物の名前が入っていなくても検索対象
- 同一人物確認用ではなく、あくまで検索の迅速化を目的とする
- Amazon Rekognition の利用検討
- 高精度の顔画像検索システムを作りたい
- 様々な OSS 等を比較した結果 Rekognition が一番精度とコストのバランスが良かった
- 簡単に実装したい
- API を叩くだけで良かった
- 低コストで運用したい
- 月数万円で運用できている
- 高精度の顔画像検索システムを作りたい
- Rekognition で顔検出と分析
- 課題
- Similality を指定するが、95 以下を指定すると別人がヒットする確率が高くなることが確認できた
- スコア 90 超えであっても間違いが多い
- 不要な顔画像が登録される問題があった
- 誤検知の原因となる
- スポーツなど、観客が多数写っている画像では全てが登録されてしまう
- 対策として、SageMaker の利用を検討
- GluonCv Classification を利用
- 画像認識タスクをサポートするモデルを提供している
- 閾値として probability を使用
- 不要な顔画像を除去できるようになった
- 対策として、SageMaker の利用を検討
- 導入効果
- 写真を効率よく検索できるようになった
- システム開発は 2週間程度
- コストも 10万程度で運用
- 誰だろうシステムについて
- 複数人物が写っている写真だとキャプションの情報が不足しているケースが多い
- 「〜ら」でまとめられているケースが多い
- 団体競技の選手は名字しか登録されていない
- Recognition を利用してキャプションを補完することを検討した
- どんなシステム?
- 写真に写っている人物を推測するシステム
- Web/API 共に利用可能
- AWS 上に構築
- 苦労した点
- 顔画像の分割
- Rekognition は画像を分割してから利用する必要があった
- 写真に写っている人物を推測するシステム
- 精度について
- 画像認識の精度は日々向上しているが、どうしても 100% にはならない
- 最後の確認は人の目でやることが大切
- 複数人物が写っている写真だとキャプションの情報が不足しているケースが多い
- その他の取り組み
- モノクロ画像のカラー化
- 画像の高解像度化
- OCR 技術で新聞紙面を検索
おわりに
Inter BEE 2020 ONLINE のセッション「AWSのAI/Machine Learning/IoT を活用したメディア業界最新事例」のレポートでした。
IoT や ML については全然詳しくないのですが、今後は必要不可欠な技術要素となる事をひしひしと感じられるセッションでした。
私自身もキャッチアップしていきたいと思います。
以上、AWS 事業本部の大前でした。